GAIA-2 是一个先进的视频生成模型,用于创建安全的自动驾驶场景。
GAIA-2 是 Wayve 开发的先进视频生成模型,旨在为自动驾驶系统提供多样化和复杂的驾驶场景,以提高安全性和可靠性。该模型通过生成合成数据来解决依赖现实世界数据收集的限制,能够创建各种驾驶情境,包括常规和边缘案例。GAIA-2 支持多种地理和环境条件的模拟,帮助开发者在没有高昂成本的情况下快速测试和验证自动驾驶算法。
CogView4 是一个支持中文和英文的高分辨率文本到图像生成模型。
CogView4 是由清华大学开发的先进文本到图像生成模型,基于扩散模型技术,能够根据文本描述生成高质量图像。它支持中文和英文输入,并且可以生成高分辨率图像。CogView4 的主要优点是其强大的多语言支持和高质量的图像生成能力,适合需要高效生成图像的用户。该模型在 ECCV 2024 上展示,具有重要的研究和应用价值。
olmOCR-7B-0225-preview 是一个基于 Qwen2-VL-7B-Instruct 微调的文档图像识别模型,用于高效转换文档为纯文本。
olmOCR-7B-0225-preview 是由 Allen Institute for AI 开发的先进文档识别模型,旨在通过高效的图像处理和文本生成技术,将文档图像快速转换为可编辑的纯文本。该模型基于 Qwen2-VL-7B-Instruct 微调,结合了强大的视觉和语言处理能力,适用于大规模文档处理任务。其主要优点包括高效处理能力、高精度文本识别以及灵活的提示生成方式。该模型适用于研究和教育用途,遵循 Apache 2.0 许可证,强调负责任的使用。
Magic 1-For-1 是一个高效的图像到视频生成模型,可在一分钟内生成一分钟的视频。
Magic 1-For-1 是一个专注于高效视频生成的模型,其核心功能是将文本和图像快速转换为视频。该模型通过将文本到视频的生成任务分解为文本到图像和图像到视频两个子任务,优化了内存使用并减少了推理延迟。其主要优点包括高效性、低延迟和可扩展性。该模型由北京大学 DA-Group 团队开发,旨在推动交互式基础视频生成领域的发展。目前该模型及相关代码已开源,用户可以免费使用,但需遵守开源许可协议。
Kimi 视觉模型可理解图片内容,包括文字、颜色和物体形状等。
Kimi 视觉模型是 Moonshot AI 开放平台提供的先进图像理解技术。它能够准确识别和理解图片中的文字、颜色和物体形状等内容,为用户提供强大的视觉分析能力。该模型具有高效、准确的特点,适用于多种场景,如图像内容描述、视觉问答等。其定价与 moonshot-v1 系列模型一致,根据模型推理的总 Tokens 计费,每张图片消耗的 Tokens 为固定值 1024。
免费 npm 库,用 Llama 3.2 Vision 进行 OCR,输出 markdown 文本
开源 npm 库,免费使用 Llama 3.2 Vision 进行 OCR,支持本地和远程图像,计划支持 PDF,受 Zerox 启发,有免费和付费接口
AuraSR 是基于 GAN 的超分辨率图像处理模型,可用于提升生成图像的质量。
AuraSR 是基于 GAN 的 Super-Resolution 模型,通过图像条件化增强技术,提升生成图像的质量。该模型采用 GigaGAN 论文的变体实现,并使用 Torch 框架。AuraSR 的优势在于能够有效提高图像的分辨率和质量,适用于图像处理领域。
个性化角色创造平台,AI 乌托邦 PRO,打造新一代超拟人 AI 智能体。
乌托邦是一个个性化角色创造平台,致力于打造新一代超拟人 AI 智能体。其主要优点包括更可控、拟人、安全。背景信息显示该产品注重用户参与创造,定位于提供高度个性化的角色模型。
基于先进 AI 模型的图像修复工具。
IOPaint 是一个免费、开源且完全可自托管的修复 / 填充工具,使用最先进的 AI 模型。它可以帮助用户删除图像中的不需要的对象、修复瑕疵、添加新对象、扩大图像等。
AI 时尚模型,用于电商卖家
Modeli.ai 是下一代 AI 模型,利用 AI 模型快速生成视觉吸引力强、成本效益高的时尚服装描述。它可以节省 80% 的拍摄成本和时间,增加产品的图片数量,提高转化率。
3,600+ AI 模型生成的照片
iStock 提供 3,600 多张由 AI 模型生成的照片。用户可以在这个网站上搜索高质量的照片,这些照片都是使用 AI 技术生成的,用户可以在其他地方找不到这样的照片。
Windows AI Studio 简化生成式 AI 应用程序开发
Windows AI Studio 通过将来自 Azure AI Studio Catalog 和 Hugging Face 等目录的先进 AI 开发工具和模型集合在一起,简化了生成式 AI 应用程序的开发。您可以浏览由 Azure ML 和 Hugging Face 提供支持的 AI 模型目录,将其下载到本地,进行微调、测试并在 Windows 应用程序中使用。所有计算都在本地进行,请确保您的设备能够承受负载。未来,我们计划将 ORT/DML 集成到 Windows AI Studio 工作流中,以便开发人员可以在任何 Windows 硬件上运行 AI 模型。
© 2025 AIbase 备案号:闽ICP备08105208号-14